山西农业大学农业基因资源研究中心、中国农业科学院作物科学研究所与华大科技合作完成高粱完整T2T参考基因组
高粱(Sorghum bicolor L.),全球第五大粮食作物,具有适应性强、抗旱、耐涝、耐盐碱、耐瘠薄、耐高温等抗逆特性,广泛种植在干旱、半干旱地区,是非洲和亚洲约5亿人的主食,同时也是动物饲料、糖、纤维、生物燃料的重要来源。
近日,山西农业大学农业基因资源研究中心/农业农村部黄土高原作物基因资源与种质创制重点实验室、中国农业科学院作物科学研究所联合华大科技,在Scientific Data(JCR Q1区,IF5year=8.9)上发表题为“Telomere-to-telomere genome assembly of sorghum”的文章。该研究成功构建了一个古老高粱地方品种矬护巴子(CHBZ)端粒到端粒(T2T) Gap-Free参考基因组,为后续高粱遗传学、基因组学和进化史研究提供了重要基础。(点击文末“阅读原文”查看文献)
01
基因组组装与组装质量评估
研究团队利用28.65 Gb PacBio HiFi数据(~40X,N50=16,638 bp)、304.06 Gb Oxford Nanopore超长(~419X,N50=52,442 bp)和304.93 Gb高通量染色体构象捕获(Hi-C) DNBSEQ测序数据(~421X),123.3 Gb转录组数据,成功构建高粱(CHBZ)端粒到端粒(T2T) Gap-Free参考基因组。
图1 (a) CHBZ植物照片
(b) CHBZ基因组的基因组Circos图
组装得到的CHBZ基因组大小约为724.85 Mb,Contig N50=71.06 Mb,包含10条染色体,成功识别10个着丝粒和20个端粒,端粒重复次数明显高于BTx623基因组。且在完整性方面表现出较高质量:BUSCO评分99.01%,k-mer完整性:98.88%,QV:61.60,LTR组装指数(LAI)值:23.63。
图2 CHBZ基因组组装质量评估
(a) 端粒、着丝粒检测图
(b) CHBZ和BTx623基因组中端粒重复次数统计
(c) Hi-C互作热图 (d) BUSCO评估
02
基因组注释
该研究使用RepeatModeler(v1.0.4)识别de novo重复序列,使用LTR-FINDER(v1.0.7)注释长末端重复序列,随后使用RepeatMasker(v4.0.7),RepeatProteinMasker(v4.0.7)识别DNA和蛋白质转座因子(TE)。利用TandemRepeatFinder(v4.10.0)进行串联重复序列分析,共获得510.36 Mb(~70.41%)重复序列。
研究团队采用基于转录组预测、同源比对预测、从头预测的方法进行基因预测和功能注释,共鉴定到32,855个蛋白质编码基因。其中,32,746个基因(99.67%)在至少一个功能数据库中进行了注释。注释结果与玉米(T2T Mo17)、水稻(T2T-NIP)、高粱BTx623进行外显子长度、内含子长度频率检测,检测结果显示一致性较高。此外,25,873个基因(78.75%)在15个RNA测序数据集中表现出可检测的转录活性(FPKM≥1)。且预测蛋白质的完整BUSCO评分约为99.38%,表明基因注释表现出了较高的准确性与完整性。
图3 蛋白质编码基因质量评估
03
比较基因组分析
此外,为进一步确定CHBZ和BTx623(GCF_000003195.3)基因组之间的同源关系,使用JCVI(v1.1.18)检测CHBZ和BTx623基因对之间的同源区块。分析结果产生24,685个直系同源对:CHBZ中有24,639个(74.6%),BTx623 中有24,637个(72.2%)。与BTx623基因组相比,已鉴定出161个CHBZ特异性存在/缺失变异基因(PAVs),并且其中129个基因至少在一个RNA-Seq样本中表达。
图4 CHBZ和BTx623之间的同源关系和PAV
高粱CHBZ高质量T2T Gap-Free完整基因组的完成,为揭示CHBZ重要农艺性状形成提供了坚实的基础,并且为高粱及其他C4作物遗传研究和育种提供了重要参考。
山西农业大学农业基因资源研究中心李萌、王海岗、秦慧彬、侯森,华大科技陈春海等为论文共同第一作者,山西农业大学农业基因资源研究中心穆志新、中国农业科学院作物科学研究所刘敏轩、华大科技高鹏为论文共同通讯作者。该研究得到山西省农业种质资源保护与利用项目和山西省基础研究计划项目资助。
高粱基因组研究历史进展
2009年
第一个高粱参考基因组(BTx623)发布[1]
2018年
高粱自交系Tx430转化系基因组破译[2]
2019年
甜高粱基因组发布[3]
2021年
高粱第一个泛基因组测序完成[4](华大参与)
2023年
七个高质量高粱细胞器基因组发表[5]
2024年
BTx623、Ji2055高粱自交系的完整T2T基因组发表[6,7]
华大科技依托专业的技术平台、实验和生信分析能力,提供动植物T2T基因组、泛基因组以及种质资源数字化一站式解决方案等服务,助力动植物基因组更前沿的研究,为您的基因组学研究保驾护航!
华大科技基因组组装优势
强大提取能力,高质量测序结果
不同物种、组织提取经验丰富,能够有效从各种样本中提取高质量的DNA,从样本提取、建库到测序,严格质控,层层把关
专业分析流程,全方位方案设计
从业多年博士级别专家提供从材料选取、测序到分析全流程方案设计,为您量身定制基因组解决方案
高水平组装质量,分析结果可靠
华大科技拥有超过5,000次de novo组装经验,已完成1,000多个重要物种的基因组构建工作,专业分析流程确保组装结果的准确性和可靠性
标杆级别文章成果,项目经验丰富
合作发表顶级期刊文章400余篇,其中封面文章34篇,涵盖Cell、Nature、Science、Nature Genetics等国内外顶级期刊,成果卓越
欲知更多详情,
请联系华大科技当地销售代表↓↓↓
热线电话:400-706-6615
邮箱:info@genomics.cn
参考文献:
[1] Paterson, A., Bowers, J., Bruggmann, R. et al. The Sorghum bicolor genome and the diversification of grasses. Nature 457, 551–556 (2009). https://doi.org/10.1038/nature07723
[2] Deschamps, S., Zhang, Y., Llaca, V. et al. A chromosome-scale assembly of the sorghum genome using nanopore sequencing and optical mapping. Nat Commun 9, 4844 (2018). https://doi.org/10.1038/s41467-018-07271-1
[3] Cooper, E.A., Brenton, Z.W., Flinn, B.S. et al. A new reference genome for Sorghum bicolor reveals high levels of sequence similarity between sweet and grain genotypes: implications for the genetics of sugar metabolism. BMC Genomics 20, 420 (2019). https://doi.org/10.1186/s12864-019-5734-x
[4] Tao, Y., Luo, H., Xu, J. et al. Extensive variation within the pan-genome of cultivated and wild sorghum. Nat. Plants 7, 766–773 (2021). https://doi.org/10.1038/s41477-021-00925-x
[5] Zhang, S., Wang, J., He, W. et al. Variation in mitogenome structural conformation in wild and cultivated lineages of sorghum corresponds with domestication history and plastome evolution. BMC Plant Biol 23, 91 (2023). https://doi.org/10.1186/s12870-023-04104-2
[6] Wei, Chuanzheng et al. “Complete telomere-to-telomere assemblies of two sorghum genomes to guide biological discovery.” iMeta vol. 3,2 e193. 5 Apr. 2024, doi:10.1002/imt2.193
[7] Deng, Yuan et al. “A complete assembly of the sorghum BTx623 reference genome.” Plant communications vol. 5,6 (2024): 100977. doi:10.1016/j.xplc.2024.100977
供稿:程宇尧
编辑:市场部
近期热文
🔍点击图片即可阅读
↓↓↓点击“阅读原文”查看文献